jjzjj

java - 从 httppost 响应中解析 xml

全部标签

ruby - 使用 ruby​​ 解析 PDF 文档

我在一个文件夹中有多个具有特定结构的PDF文档:现在我希望能够解析PDF中的信息。请注意,段落的长度各不相同。显然,我并不是要你为我解决问题,但我确实需要一些关于如何实现这一目标的指导。我以前使用过nokogiri,从技术上讲,我需要类似的东西,但用于PDF。因此我的示例的伪结果如下所示:-ItemA-Title:ItemA-File:123456789.pdf-Image:ImageA.png(theimagewasstoredondisk)-Subtitle1:Contentforsubtitle1-Subtitle2:Contentforsubtitle2-Subtitle3:C

ruby-on-rails - 如果 Mechanize 在无响应的网站上等待,我该怎么办?

我注意到当我使用Mechanize获取没有响应的站点时,它只是继续等待。我该如何克服这个问题? 最佳答案 有几种方法可以处理它。Open-Uri和Net::HTTP有传递超时值的方法,然后告诉底层网络堆栈您愿意等待多长时间。例如,Mechanize允许您在初始化实例时获取其设置,例如:mech=Mechanize.new{|agent|agent.open_timeout=5agent.read_timeout=5}所有这些都在new的文档中,但您必须查看源代码才能了解您可以获得哪些实例变量。或者你可以使用Ruby的timeout模

ruby-on-rails - 如何在 RoR 中上传文本文件并将内容解析到数据库中

到目前为止,我已经成功上传了一个文件:#Innew.html.erb并访问Controller中的文件#Incontroller#create@text=params[:upload][:file]但是,这给我的只是文件名,而不是文件的内容。如何访问其内容?我知道这是一个跳跃,但是一旦我可以访问文件的内容,是否可以上传文件夹并遍历文件? 最佳答案 完整示例以上传包含联系人的导入文件为例。您无需存储此导入文件,只需对其进行处理并丢弃即可。路线routes.rbresources:contactsdocollectiondoget'im

ruby - DateTime 解析未按预期工作

我的Ruby代码看起来像这样。str=2010-12-02_12-10-26putsstrputsDateTime.parse(str,"%Y-%m-%d_%H-%M-%S")我希望从解析中得到实际时间。相反,我得到这样的输出......2010-12-02_12-10-262010-12-02T00:00:00+00:00我如何获得解析的时间? 最佳答案 这个有效:str="2010-12-02_12-10-26"putsstrputsDateTime.strptime(str,"%Y-%m-%d_%H-%M-%S")这个例子在C

ruby-on-rails - 用于 ruby​​/rails 的自然语言日期解析器

有人知道类似于Date.js的东西吗?在ruby?能够从诸如“从今天起两周”之类的东西返回日期对象的东西。RemembertheMilk网络应用程序将此功能整合到他们的系统中,而且非常易于使用。我会使用Date.js库本身,但因为它在客户端,所以有其局限性。如果用户没有启用javascript,则该功能将丢失。这会影响手机用户,理想情况下,他们会通过短信(sms)使用我们的系统。我很想使用已经存在的解决方案,但如果不是,将此代码移植到Ruby中会有多难?我真的不太了解自然语言解释,但似乎需要一些时间。谢谢。 最佳答案 不要忘记在Ru

ruby - 使用 ruby​​-yajl 解析大型 JSON 哈希?

我有一个包含JSON散列的大文件(>50Mb)。像这样的东西:{"obj1":{"key1":"val1","key2":"val2"},"obj2":{"key1":"val1","key2":"val2"}...}与其解析整个文件并取前十个元素,不如解析散列中的每个项目。我实际上并不关心key,即obj1。如果我将上面的转换为:{"key1":"val1","key2":"val2"}"obj2":{"key1":"val1","key2":"val2"}我可以使用Yajl流轻松实现我想要的:io=File.open(path_to_file)count=10Yajl::Parse

ruby-on-rails - 使用机架中间件捕获无效的 JSON 解析错误

我正在使用Rails5,我正在尝试改进对我的API的无效JSON请求的错误处理。我尝试通过救援在Controller中解析来处理无效格式的JSON,但意识到如果用户将ContentType添加到他们的请求header,Rails中间件会在我的JSON请求到达Controller之前解析它。我遵循了以下指南:https://robots.thoughtbot.com/catching-json-parse-errors-with-custom-middleware但是,在启动服务器时出现以下错误:.rbenv/versions/2.3.1/lib/ruby/gems/2.3.0/gems

ruby-on-rails - XPath 或 CSS 解析速度更快(对于 HTML 文件上的 Nokogiri)?

我想知道NokogiriXPath或CSS解析是否可以更快地处理HTML文件。速度有何不同? 最佳答案 Nokogiri没有XPath或CSS解析。它将XML/HTML解析为单个DOM,然后您可以使用CSS或XPath语法进行查询。CSS选择器在要求libxml2执行查询之前在内部转换为XPath。因此(对于完全相同的选择器)XPath版本会快一点点,因为CSS不需要先转换成XPath。但是,您的问题没有通用答案;这取决于您选择的是什么,以及您的XPath是什么样的。很有可能,您不会编写与Nokogiri创建的相同的XPath。例如

ruby - 如何让 Ruby JSON 解析器忽略 json_class?

我有一个序列化的JSON字符串(实际上是chef角色定义),它有一个json_class键,使ruby​​JSON解析器试图强制它成为一个Chef::Role对象。我怎样才能让解析器忽略这个键,只是简单地反序列化成一个普通的哈希? 最佳答案 我遇到了同样的问题,通过阅读JSONgem的源代码找到了答案——在尝试解析之前取消设置JSON.create_id:JSON.create_id=nilJSON.parse('{"json_class":"Chef::Role"}').class=>Hash编辑:请注意,由于gem的版本为1.7

ruby - URI 响应代码

我想使用Ruby的OpenURI检查该URL是否可以正常访问。所以我想查看它的响应代码(4xx或5xx表示错误等)是否可以找到? 最佳答案 您可以使用status方法返回包含状态代码和消息的数组。require"open-uri"open("http://www.example.org")do|f|putsf.base_uri#=>http://www.example.orgputsf.status#=>["200","OK"]end 关于ruby-URI响应代码,我们在StackOve